首页> 外文OA文献 >Beyond Stemming and Lemmatization: Ultra-stemming to Improve Automatic Text Summarization
【2h】

Beyond Stemming and Lemmatization: Ultra-stemming to Improve Automatic Text Summarization

机译:超越词干和词形还原:超级词干来改善自动化   文本摘要

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

In Automatic Text Summarization, preprocessing is an important phase toreduce the space of textual representation. Classically, stemming andlemmatization have been widely used for normalizing words. However, even usingnormalization on large texts, the curse of dimensionality can disturb theperformance of summarizers. This paper describes a new method for normalizationof words to further reduce the space of representation. We propose to reduceeach word to its initial letters, as a form of Ultra-stemming. The results showthat Ultra-stemming not only preserve the content of summaries produced by thisrepresentation, but often the performances of the systems can be dramaticallyimproved. Summaries on trilingual corpora were evaluated automatically withFresa. Results confirm an increase in the performance, regardless of summarizersystem used.
机译:在自动文本摘要中,预处理是减少文本表示空间的重要阶段。传统上,词干和词残化已广泛用于归一化单词。但是,即使对大文本使用归一化,维数的诅咒也会干扰汇总器的性能。本文介绍了一种新的词归一化方法,以进一步减少表示空间。我们建议将每个单词减少到其首字母,作为一种超词干形式。结果表明,超梗不仅保留了此表示产生的摘要的内容,而且常常可以显着改善系统的性能。使用Fresa自动评估三语语料库的摘要。无论使用哪种汇总器系统,结果都可以确保性能的提高。

著录项

  • 作者

    Torres-Moreno, Juan-Manuel;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号